SnapIT: Buscar texto extraído de una imagen automáticamente

Puede combinar la acción Rellenar buscar correspondencias que se describe en Rellenar la colección de Búsqueda de conocimiento con la capacidad de extraer texto de una imagen mediante las tecnologías Reconocimiento óptico de caracteres (OCR) que se describen en Extraer texto a partir de imágenes, como parte de un proceso para proporcionar una función que llamamos SnapIT. SnapIT permite a los usuarios finales buscar texto extraído de una imagen, como parte de un proceso. Por ejemplo, si un usuario final recibe un mensaje de error, podría utilizar la captura de pantalla o fotografiar el mensaje, registrar una incidencia con esta imagen como atributo de archivo adjunto y recibir automáticamente sugerencias de soluciones para el error.

Esta sección describe cómo extraer texto de una imagen y buscar la base de datos de conocimiento para este texto, como parte del proceso de una Incidencia. Puede utilizar técnicas similares para utilizar esta función en otros módulos.

Es recomendable que integre esta solución de manera gradual, asegurándose de que cada parte funciona antes de continuar con la siguiente. En primer lugar, implemente la extracción de texto de una imagen.

Configuración del sistema OCR

La tecnología OCR (Abbyy) se aloja en la nube y debe suscribirse y registrar una cuenta en abbyy.com para que su empresa la utilice. Luego deberá crear una aplicación en el sitio web de Abbyy para que el sistema la utilice.

Para introducir los detalles de la aplicación OCR de su empresa:

  1. En la consola de Ivanti, en el menú de Configuración, haga clic en Sistema.
    Aparece Ajustes del sistema.
  2. En Configuración de la api OCR, ajuste los valores siguientes:
    Url: la URL para el sitio web de OCR. Ajuste ésta a https://cloud.ocrsdk.com/
    Id. de cuenta: el nombre de la aplicación Abbyy.
    Contraseña de la cuenta: la contraseña de la aplicación Abbyy.
    Tiempo de espera máximo: el tiempo que desea que espere una respuesta. Hemos descubierto que después de 10 segundos, cualquier resultado es de poca calidad, así que recomendamos ajustar este valor a 10.
  3. Guarde la configuración.

Configurar el comportamiento del OCR

Cuando haya configurado los valores del sistema del OCR, puede ajustar el objeto y los atributos que se utilizarán para guardar la imagen y el texto extraído.

Para configurar el comportamiento de OCR:

  1. Mediante Diseñador de objetos, agregue el comportamiento OCR al objeto desde el que desee utilizar la función OCR.
    Por ejemplo, Gestión de incidentes\incidente.
  2. Haga clic en Aceptar y guarde los cambios.

    Se agregará automáticamente un nuevo atributo al objeto denominado Estado de OCR. Este atributo se utiliza para registrar si la solicitud de OCR funciona. 0 = ninguno, 1 = correcto, 2 = error.

    Además, se crea una nueva acción que puede utilizar en el Diseñador de procesos denominado Extraer texto.

Cuando haya creado el objeto con el comportamiento OCR, puede configurar los atributos que guardarán la imagen y el texto que se haya extraído.

  1. Agregue un atributo al objeto y ajuste el Tipo de datos del atributo como Archivo adjunto.

    Por ejemplo, Archivo adjunto de OCR.

Asegúrese de que ajusta la propiedad Tipo de archivo adjunto como Ninguno.

  1. Ajuste la propiedad ¿Habilitar extracción de texto? para el atributo como Verdadero y guarde los cambios.

    Se agregará un nuevo atributo al objeto, denominado Texto del título del atributo.

    Por ejemplo, Texto del archivo adjunto de OCR. Este es el atributo que guardará el texto extraído de la imagen.

Puede cambiar el texto de la acción Extraer texto (y agregar versiones multilingües) mediante el árbol Objetos de negocio en el Diseñador de procesos. Para obtener información sobre cómo usar el Diseñador de procesos, consulte Diseñador de procesos. Para obtener más información sobre cómo crear un sistema multilingüe, consulte Diseñar un sistema multilingüe.

Puede agregar la propiedad ¿Habilitar extracción de texto? a más de un atributo de archivo adjunto en el mismo objeto. En esta instancia, cada atributo tendrá su propio atributo Texto de... pero utilizará la misma acción Extraer texto.

Diseñar la ventana y el proceso para la extracción de texto

Cuando haya ajustado la configuración del sistema de OCR y el comportamiento OCR en el objeto requerido, puede diseñar la ventana y el proceso necesarios para la extracción de texto.

Para crear la ventana y el proceso:

  1. Mediante Administrador de ventanas, agregue los atributos Archivo adjunto de OCR y Texto del archivo adjunto de OCR a la ventana Incidencia.

También puede agregar el atributo Estado de OCR a la ventana durante la fase de diseño para ayudar con cualquier depuración. No obstante, le recomendamos que vuelva a trasladar el atributo Estado de OCR antes de migrar el diseño a la versión activa. También puede ampliar el proceso para registrar una incidencia si el Estado de OCR que se devuelve es 2.

  1. En Diseñador de procesos, cree un proceso nuevo en Incidencia/Administración/Incidencia.

Para obtener información sobre cómo usar el Diseñador de procesos, consulte Diseñador de procesos.

  1. Expanda el Cuadro de herramientas (Icono Cuadro de herramientas) y arrastre Icono Punto de inicio al espacio de trabajo.
  2. Arrastre una Acción de instancia automática sobre el espacio de trabajo.
    Aparece el cuadro de diálogo Seleccionar acción.
  3. Seleccione Extraer texto y a continuación, haga clic en Aceptar.
    El diálogo se cierra y se actualiza el texto de Acción de instancia automática.
  4. Arrastre un Estado de inicio sobre el espacio de trabajo.
    Aparece el cuadro de diálogo Seleccionar estado.
  5. Seleccione Abrir y a continuación, haga clic en Aceptar.
  6. Vincule Icono Punto de inicio a la acción Extraer texto y la acción Extraer texto al estado Abierto.
  7. Complete el proceso como sea necesario, guárdelo y actívelo.

Diagrama del Proceso de OCR

  1. En Web Access, agregue un acceso directo de proceso al proceso que ha creado.

Para obtener más información sobre cómo agregar accesos directos a Web Access, consulte Agregar elementos a la barra de accesos directos. Si agrega un acceso directo a Self Service, también estará disponible en Ivanti Workspaces.

Ahora que ha completado el diseño, los usuarios pueden utilizar el nuevo progreso para buscar el texto extraído de una imagen.

Para extraer el texto de una imagen:

  1. Haga clic en el nuevo acceso directo para mostrar la ventana de Incidencia y rellene los campos obligatorios.
  2. Haga clic en Elegir archivo o en Explorar que aparece junto al campo Archivo adjunto de OCR (la etiqueta depende del explorador que esté utilizando) y seleccione una imagen que contenga texto.

Si utiliza Workspaces en un dispositivo que tenga una cámara principal adecuada, dispondrá de la opción de escoger una imagen existente o sacar una fotografía.

  1. Guarde la incidencia.
    Tras unos momentos, la incidencia se guardará y el campo Texto del archivo adjunto de OCR se actualizará para incluir el texto extraído de la imagen. Si ha agregado el campo Estado de OCR a la ventana, leerá 1 si la solicitud de OCR es correcta o 2, si falla.

Implementar SnapIT

Cuando termine de ajustar la función de OCR, podrá ajustar la función de búsqueda de conocimiento, de manera que busque automáticamente texto extraído en la base de datos de conocimiento en el campo Texto del archivo adjunto de OCR.

Para buscar texto extraído en la base de datos de conocimiento:

  1. En el Centro de configuración, asegúrese de que Servicio en segundo plano de la sección Servicios configurados se inicia para la instancia que esté utilizando.
    El Servicio en segundo plano agrega elementos a la base de datos de conocimiento.
  2. Agregue el comportamiento Búsqueda automática al objeto Incidencia.
    Consulte Rellenar la colección de Búsqueda de conocimiento para obtener más información.
  3. En Diseñador de objetos, seleccione el atributo Texto del archivo adjunto de OCR, luego, en el cuadro Propiedades, en Gestión del conocimiento, ajuste Tipo de búsqueda como Es idioma natural y ¿Es búsqueda automática? como Verdadero y guarde los cambios.
  4. En el Administrador de ventanas, agregue la colección Buscar correspondencias a la ventana Incidencia.
  5. En el Diseñador de procesos, desactive y abra el proceso que ha diseñado antes.
  6. Arrastre una Acción de instancia automática sobre el espacio de trabajo.
    Aparece el cuadro de diálogo Seleccionar acción.
  7. Seleccione Rellenar Buscar correspondencias y a continuación, haga clic en Aceptar.
    El diálogo se cierra y se actualiza el texto de Acción de instancia automática.
  8. Conecte la acción automática Rellenar Buscar correspondencias entre la acción automática Extraer texto y el estado Abierto.

Diagrama de procesos OCR con Rellenar Buscar correspondencias

  1. Guarde y active el proceso.
  2. En Web Access, registre y guarde una incidencia mediante este proceso y adjuntando una imagen como se ha explicado antes.
    Esta vez, el campo Texto del archivo adjunto de OCR se actualiza para incluir el texto extraído de la imagen, como se ha explicado antes, pero también aparece una pestaña Buscar correspondencias en la parte inferior de la ventana. Esta pestaña contiene las mejores correspondencias de la búsqueda de conocimiento en el texto extraído de la imagen del Archivo adjunto del OCR y guardado en el campo Texto del archivo adjunto de OCR. Puede abrir los elementos desde esta pestaña para ver los detalles.

Puede utilizar un cálculo para combinar los resultados de la pestaña Buscar correspondencias en un único campo mediante la nueva función de cálculo que se ha incluido en esta versión. Para obtener más información, consulte Usar un cálculo para crear un campo único desde Buscar correspondencias.

Uso de OCR con Correo

Puede utilizar el componente Correo de la Consola para habilitar el proceso que hemos descrito para que se inicie con un correo electrónico. Cuando configura la asignación de correos electrónicos de entrada, asigne el atributo Archivo adjunto del árbol Atributos de mensajes al atributo Archivo adjunto de OCR del árbol Atributos de negocio en la ventana de Asignación.

Para obtener más información acerca de la configuración del Correo, consulte Correo.